查看原文
其他

综述 | 从认知控制的角度理解基于价值的决策

鹿鸣Cogn 2023-05-13

Editor's Note

本文转载自心理所孟同学的公众号

The following article is from 黪绿末座 Author 子自雝喈

它山之石,可以攻玉。

诗经 · 小雅 · 鹤鸣

基于价值的决策关注人们如何权衡利弊,认知控制则探究人们在追求目标时如何调整信息加工,两者讨论的问题看似不同,但实际上为探究人们如何选择思想和行动提供了平行的视角。本文综述了如何通过认知控制的视角更好地理解基于价值的决策机制


传统视角之所以很少将基于价值的决策和认知控制放在一起讨论,主要是因为两者主要的研究范式相去甚远(译者注:一边是风险、食物、商品之类的选项二选一,一边是Stroop、Flanker、Simon等等的冲突不冲突)。尽管两类任务涉及了类似的计算过程,但很大程度上被用于处理互不相关的问题(图1)。

图1 基于价值的决策和认知控制的基本机制。A) 经典的决策范式中,个体需要在两个选项中进行选择。加权的属性价值决定了每个选项的主观价值,这些选项的主观价值通过证据积累过程,决定最终的选择(注意,不同的模型在主观价值如何转化为证据积累上也存在差异)。不同的选项属性的权重取决于个体的可评估目标,例如正在节食的个体可能更加关注食品的健康属性而非口味属性。B) 经典的认知控制任务中,个体的选择取决于他们的任务目标,例如判断词义还是报告颜色。不同刺激特征的信息,通过证据积累的过程产生反应。关键是,其中一种特征的加工通路比另一种更加自动化(对应词义加工更粗的箭头),增加了干扰目标相关特征的可能性。监控这一积累过程及其结果,有助于确定何时需要额外的控制来向上调节当前的目标。

决策研究一般关注整合刺激信息选择反应的过程(图1A),涉及习得偏好(e.g., 风险偏好)、动机状态(e.g., 当前的饥饿水平)等;对应地,认知控制研究更多地关注影响反应选择过程的因素(图1B),例如人们如何增强目标特征加工、抑制无关刺激加工。
在认知控制中,刺激的意义取决于个体的目标。事实证明,决策过程中奖赏价值的意义也是如此。价值网络的BOLD信号可以表征一个选项满足我们目标的程度,哪怕我们的目标是选择其中最差的一个选项(图2)。
图2 任务目标对基于价值的决策的行为和神经机制的影响。A) 虽然可评估的目标决定了如何计算主观价值,但任务目标决定了这些价值和潜在反应之间的映射,例如选择最好的还是最差的选项。B) 先前研究凭借选择最优(choose-best)任务目标一致发现,(在难度相同的情况下)与低价值选项相比,人们总是更快地选择高价值选项。有人认为这反映了与预期价值本身相关的加速效应。根据这种基于奖赏的解释,那么个体的反应时应该随选项价值的增加而减小,无论他们的任务是选择最好的还是最差的选项(B左);相应地,根据目标一致性的解释,当个体的任务是选择最差选项时,这种典型的整体价值效应应该会逆转(B右)。在两项研究中,Frömer, Dean Wolf, 和 Shenhav (2019) 发现行为结果与目标一致性解释一致(B下)。C) 价值网络中BOLD活动以目标特异(方向灵活)而不是价值特异(方向恒定)的方式追踪个体的选项的相对和整体价值。除了目标价值之外,该研究还发现了与选项的整体价值相关的BOLD活动,可能反映了与自动评估相关的其他过程(c.f. 图3)。

一般认为,与选项价值相关的神经活动反映了目标导向的决策过程的成分,例如选项评估和/或对比。但事实上,这些价值信号可能既反映了目标导向的过程(i.e., 选择),也反映了价值表征中更加自动化的过程,还有可能同时反映两者(图3A)。
研究发现,价值网络的腹侧区域(包括mOFC)在选择时的激活显著强于评估时,这体现了目标导向的过程;相对地,背侧区域包括pgACC)的激活与个体对选项集合的整体评价相关,而与当前试次的任务目标无关(图3B)。
进一步地,近期研究还发现评估相关和选择相关的信号具有不同的时空特征:评估相关的变量(e.g., 整体价值,选项集的喜爱程度)则与刺激锁时的位于顶叶的脑电活动相关;选择相关的变量(e.g., 价值差异,选择信心)与反应锁时的位于额中、顶中的脑电活动相关(图3C)。

图3 价值在评估和目标导向处理中的双重作用。A) 主观价值的作用不仅体现在决定选择时(蓝色虚线方块),也体现在独立的评估过程中(绿色虚线方块)决策以外的功能,例如情感体验和接近/回避倾向。B)奖励加工始终激活由 vmPFC、纹状体和后扣带皮层组成的网络(B左上)。Shenhav 和 Buckner (2014) 发现了追踪选项评估(背侧)和决策(腹侧)的两个网络的分离(B左下)。随后,Shenhav 和 Karmarkar (2019) 又发现,背侧网络追踪人们对选项的总体喜欢程度,与具体执行任务无关(B右上);而腹侧网络,相较于评估任务,在执行选择任务时显著更加活跃(B右下)。C) Frömer, Nassar, Ehinger 和 Shenhav(in submission)表明,评估相关的变量与刺激锁时的活动相关,而选择相关的变量与反应锁时的活动相关。这些发现与选项评估出现更快相一致,并且与导致个体反应的目标导向过程同步。

认知控制在决策的调整中也扮演着多重角色。
一是影响信息流,通过将注意战略性地分配给不同的选项,增加受注意的选项在证据积累中的影响,即所谓的注意的漂移扩散模型(aDDM)。期间,决策者持续地判断是继续关注当前选项还是切换到其他选项(图4A)。
二是影响决策阈值,通过调整决策所需的信息阈值,从而为冲突较大的困难决策争取更多时间(图4B)。
三是影响我们选择的选项,我们可能在证据积累之前就已经对特定选项存在偏好,从而造成起始点的偏移。尽管这有助于我们选择自己偏好的选项,但我们偏好的选项未必是当前情境下的最优选择,克服偏好意味着更大的认知冲突,并且伴随着dACC的激活(图4C)。

图4 控制我们正在进行的决策。A) 控制影响信息流。左:在注意漂移扩散模型中,注意会影响确定漂移率时每一个选项值被分配的权重,受到注意的选项会产生更大的影响,从而导致更有可能被选择。右:近期的研究不仅解释了这种注意效应,还解释了如何以目标导向的范式分配注意从而减少选择的不确定性。决策者持续判断是否在当前注意的选项上继续信息采样,或转而注视其他选项,还是根据现有的信息做出决策。选项的价值是基于贝叶斯价值估计随时间推移而估计出来的,因此瞬时价值表征逐渐趋近于选项的真实价值,同时不确定性逐渐降低。注意影响了贝叶斯价值估计所依赖的瞬时证据的精度。B) 控制影响决策阈值。当个体检测到冲突(黄色箭头),可以通过增加阈值来为准确决策争取更多的时间。C) 控制支持推翻选择偏差。选择偏差会改变证据积累的起始点,例如重复先前的选择或默认选项。虽然这有利于做出符合自己偏差的反应,但需要控制来克服决策中自己的偏差。

不仅如此,控制不仅负责监控我们当前的选择,还会整合信息,从而在跨多个时间尺度抽象水平上调整策略和任务选择,优化决策(图5A)。
尽管只有决策之前的信息才能用于调整决策的各项参数,但在决策过程中持续监控并且动态更新决策质量的评估是可行的(图5B)。
一方面,较低的信心可能说明决策前尚未取得充足的证据,从而需要更高的决策阈值避免重复不成熟的反应;另一方面,也可能说明当前决策可获得的信息较弱,没有必要延长证据积累的过程,从而降低决策边界(图5D)。

图5 通过监控指导多个水平中的行为。A) 监控不仅能提示对正在进行的选择的控制,还能提示更高阶的策略和任务选择。B) 表现监控为个体的选择过程提供了持续的评估读数。随着个体决策变量的变化,对信息和不确定性的估计也不断更新。这里,作者阐述了一个想法的改变,即最初的决定被确认为错误的并被推翻。请注意,不确定性是随着右侧选项的证据赶上左侧选项的证据而增加的,然后随着冲突得到解决并正确识别右侧选项而再次降低。最初决策的信心较低,错误在接近边界时被探测到。C) 信心随自己的选择正确/良好的估计概率单调增加。相较之下,当探测到错误并且这个反应是明确无误时,不确定性也较低。D) 不确定性可以通过更长的采样时间来减少,但也受到证据强度的影响。采样在证据强度较高时更为有效,从而提高确定性和信心。个体过去的信心经验可以为是否值得进一步的证据积累提供参考。

综上,作者重点关注了认知控制与基于价值的决策在以下三个领域中的相互转换:1)不同类型的目标如何影响选项评估;2)人们如何使用控制来调整他们决策的方式;3)人们如何在多个水平和时间尺度上监控决策来调整认知控制
目前,决策和认知控制的交叉研究已经取得了引人注目的进展,将认知控制的思想融入基于价值的决策中又为我们提供了新的视角。随着不同领域交叉研究的不断增多,不同领域之间将会继续发现彼此理论和实验之间的缺口,并通过合作迅速地填补这些缺口。

论文原文:
Frömer, R., & Shenhav, A. (2021). Filling the gaps: Cognitive control as a critical lens for understanding mechanisms of value-based decision-making. Neuroscience & Biobehavioral Reviews, 104483. https://doi.org/10.1016/j.neubiorev.2021.12.006 

相关文献:
Frömer, R., Dean Wolf, C. K., & Shenhav, A. (2019). Goal congruency dominates reward value in accounting for behavioral and neural correlates of value-based decision-making. Nature Communications, 10(1). https://doi.org/10.1038/s41467-019-12931-x 
Shenhav, A., & Buckner, R. L. (2014). Neural correlates of dueling affective reactions to win–win choices. Proceedings of the National Academy of Sciences, 111(30), 10978-10983. https://doi.org/10.1073/pnas.1405725111 
Shenhav, A., & Karmarkar, U. R. (2019). Dissociable components of the reward circuit are involved in appraisal versus choice. Scientific Reports, 9(1), 1958. https://doi.org/10.1038/s41598-019-38927-7 




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存